IntroducciĂłn

Célida López Cárdenas, Andrés Manuel López Obrador y Claudia Pavlovich

Célida López Cárdenas, Andrés Manuel López Obrador y Claudia Pavlovich


ÂżLa polaridad de sentimientos en twitter se ha visto afectada por el nĂşmero de casos confirmados de COVID-19?

El objetivo de este storyboard es responder esa pregunta para tres niveles de gobierno:

Para el análisis de sentimientos se utilizó una traducción automática del léxico Afinn; éste, es un conjunto de palabras con puntuación entre -4 y -1 si son percibidas de forma negativa y entre 1 y 4 si se perciben positivamente; si bien tiene sus limitaciones, cumple con el propósito de este proyecto.

Un análisis exploratorio totalmente apartidista

Este es el top 10 de palabras positivas, los usarios están ordenados según su screen name en twitter

La diferencia de vocabulario entre usuarios es evidente; se muestra el top 10 de palabras con carga negativa

Análisis de sentimientos por fecha. En la gráfica se muestran datos interpolados linealmente y con suavizamiento por medias móviles.

screenName n
CelidaLopezc 1143
ClaudiaPavlovic 1881
lopezobrador_ 1104
# A tibble: 3 x 2
  screenName       media
  <chr>            <dbl>
1 CelidaLopezc     0.987
2 ClaudiaPavlovic -0.525
3 lopezobrador_    0.229

Casos confirmados por día en México vs puntos promedio del Presidente de la República



    Pearson's product-moment correlation

data:  df$confirmados.Nacional and df$lopezobrador_
t = -0.85188, df = 104, p-value = 0.3962
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.2697160  0.1092467
sample estimates:
        cor 
-0.08324343 

Nube de palabras de Andrés Manuel López Obrador

Casos confirmados por dĂ­a en Sonora vs puntos promedio de la Gobernadora del Estado



    Pearson's product-moment correlation

data:  df$confirmados.Sonora and df$ClaudiaPavlovic
t = -0.050317, df = 105, p-value = 0.96
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1945874  0.1851206
sample estimates:
         cor 
-0.004910353 

Nube de palabras de Claudia Pavlovich Arellano

Casos confirmados por dĂ­a en Hermosillo vs puntos promedio de la alcaldesa de Hermosillo



    Pearson's product-moment correlation

data:  df$confirmados.Hermosillo and df$CelidaLopezc
t = -2.8608, df = 56, p-value = 0.005929
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.5634180 -0.1088311
sample estimates:
       cor 
-0.3570889 

Nube de palabras de Célida López Cárdenas

Algunas referencias…

Datos de COVID19 descargados en:

https://www.gob.mx/salud/documentos/datos-abiertos-152127

Para imputar datos:

https://towardsdatascience.com/how-to-handle-missing-data-8646b18db0d4

Ejemplos de análisis de sentimientos en twitter:

https://rpubs.com/Joaquin_AR/334526

https://rpubs.com/jboscomendoza/analisis_sentimientos_lexico_afinn